中国最容易和最难被GPT所代替的TOP25职业！

与数据同行

2024-09-26

OpenAI 研究人员曾发文称「约 80% 美国人的工作将被 AI 影响」。

文章的结论是，至少80%的美国劳动力会受到影响，他们的工作的10%会被GPT所替代。其中甚至有19%的美国劳动力的50%工作会被替代。

但需要注意的是，OpenAI的研究是对于美国职业来说的，中国的劳动力市场和美国有不少差异。

那中国的劳动力市场，有哪些职业的替代率最高，哪些职业的替代率最低呢？

今天看到了一篇详细的，用数据分析的结论，分享给大家！

作者：chenqin | 编辑：Jack Cui

因此最近两周，我们使用中国在过去8年的数亿条招聘数据完成了这个研究，看中国哪些职业最有可能被GPT之类的大语言模型和其衍生品替代。

分析不同职业被GPT替代的可能性，需要对每种职业的职能和具体工作进行分拆。

比如你笼统地问，“人力资源专员”这个职业，被GPT替代的可能性有多大呀？

这类问题就不好回答，因为太模糊了。

但是你可以根据招聘网站的情况，将“人力资源专员”给分拆成不同的职能，比如：

1、新员工的招聘，员工入职手续办理
2、安排以及开展新员工入职培训
3、考勤及工资绩效的核算
4、维护和拓展公司招聘渠道，协助社招及其他招聘活动

去问其中一个职能，例如“安排以及开展新员工入职培训”，人力资源专员工作的这一部分有多大可能被GPT替代，就直观了一些。

我们还可以继续分拆，把“安排以及开展新员工入职培训”，进一步分拆成下列具体工作内容——1，撰写、准备培训材料；2，交流、沟通并安排计划时间表；3，演讲、培训，提升员工技能……

再问其中每一个具体工作，

撰写准备培训材料，GPT可以替代多少？

交流和沟通安排时间表，GPT可以替代多少？

演讲培训，GPT可以替代多少？

我们用O*net的数据，将中国的职业映射到O*net，再分拆成19265条工作任务和23534种工作内容。

这么分拆下来，每一个职业拆分研究，再汇总，那么我们对每一个职业中有多少部分可以被GPT替代，就比较有把握了。

分析每一种具体的职能和工作内容被GPT替代的可能性。

但是，要分析19265种工作任务，23534种工作内容其中的每一种被GPT替代的可能性有多大，也是一个非常繁重的工作。一般来说我们会让人工来打标，这么四万条内容全部打标，大概一个人就需要1周，一个人力的成本就要至少1万元。这已经是最低的价格了。

但我们知道，在对美国研究的工作论文中，OpenAI的工作论文提出了一种重要的方法。那就是让GPT来打标。

那我们何不也用GPT来打标呢？

于是我们用了GPT的API，让GPT扮演打分者，大概是这样的prompt：

你是一名“大型语言模型替代劳动力评估师”。大型语言模型，是一种用于处理和生成自然语言文本的深度学习模型，最新的大型语言模型能够基于自然语言文本生成、描述创建图像与视频。在这样的背景下，你需要从“该任务是否能够在大语言模型帮助下，在同样时间达成同样产出或者同样效果的前提下，减少人类劳动时间的参与”的角度，给下列每一个任务打分。评分从0到5分，0代表该任务不能通过大语言模型的帮助减少人类劳动投入，1代表可以减少20%人类劳动投入，2代表可以减少40%的人类劳动投入，3代表可以减少60%的人类劳动投入，4代表可以减少80%的人类劳动投入，5代表可以减少100%的人类劳动投入，即该任务不再需要人类劳动参与。你的评分，代表着大语言模型可以在每一个任务中节省多少比例的劳动投入，请根据当前大语言模型的进步情况和你认为未来可能的发展状况，谨慎评分。请按照“id,评分”的格式，每一行返回一条任务的评分结果。

这段算是API里面system部分输入的内容，然后在内容部分输入具体的工作任务和工作内容，GPT就会刷刷返回了，一次可以输入100条，gpt-3.5-turbo的返回很快，一屏幕一屏幕的0-5的分数就这么回来了。

说实话，在看到这一屏屏的分数出来，知道这是GPT在为自己能多大程度上替代人类劳动打分，有种审判日到了的感觉。

由于任务已经被拆解得比较细致，对于每一条任务的打标将会十分准确，稳健性也极高。更重要的是，使用GPT打标，成本之低令人发指。标注4万条内容，每次标注100条，只需要400次，一次标注和返回大约在4000token左右，且主要内容是在prompt中，使用GPT-4的模型，每标注100条，仅需要0.12美元。也就是说，共标注4万条内容，只需要耗费48美元。如果使用不那么精确，但速度更快且更便宜的gpt-3.5-tubo模型，4万条只需要耗费3美元。在这样简单的任务上，GPT-4和gpt-3.5-turbo的表现几乎没有差异。

人类数据标注员要完成4万条内容的标注，需要至少1万元，一星期。

GPT只需要半小时，3美元，合20元人民币左右。

而两者的质量是几乎一样的。

因此，很难不再次强调一遍这样的事实——

刚刚出现没几年的全新职业——人类标注员，他们喂养出来的大型语言模型GPT，在完成一项“GPT能够替代哪些职业”的标注工作任务时，首先替代掉了把GPT训练成材的人类数据标注员自己。

将标注结果汇总到职业层面

使用下图的流程，我们将每一个具体工作被GPT替代的可能性汇总到每一个职业上。

就能得到中国所有职业被GPT替代的可能性了。下表是招聘规模比较大的职业被GPT替代可能性的前25名和后25名：

上表的这50个职业，可以理解为未来职业发展的晴雨表。

AI替代率最高的职业是翻译，其次是保险核保专业人员以及剧作家。这三个职业，有90%以上的工作任务和内容都暴露在AI替代的风险中。

接下来，视觉传达设计人员、装饰美工、美术编辑、广告设计师、剪辑师，这些与美术、视频、作图相关的职业，被AI替代的工作内容也超过了80%。

文字编辑、网络编辑、文学作家、文字记者，这些与文字生成和修改高度相关的职业，被替代的工作内容也超过了75%。

呼叫中心服务员、前厅服务员（即为宾客提供咨询、迎送、入住登记、结账等前厅服务的人员）、节目主持人、秘书……这些职业，也出现在了前25名中。

不过最出乎意料的可能还是排名第25的计算机程序设计员，平均来说，程序员有75%的工作内容，面临被AI替代的风险。

AI替代率最低的职业主要是各种制造业相关蓝领人员。这并不意外，因为我们让GPT评分标注时扮演的角色就是“大型语言模型替代劳动力评估师”，它自然无法评估可能被其他机器所替代的职业。但仍然有几个制造业工人以外的人员值得注意——绿化工、保洁员、洗衣师、按摩师、美甲师、中式面点师……看起来并不需要太高学历，工资也不算最高的这些职业，反而成了最难被AI替代的职业。

容易被替代的职业都有什么样的特征？

在OpenAI的那篇工作论文中，研究者发现了稳定的正相关关系——工资越高的职业，被GPT们替代的可能性越高。这个趋势在年收入大于10万美元的职业之后才区域相反，见下图。

但在我们的研究中，在中国，每个职业能够被GPT替代的程度和该职业的收入却并没有相关性，见下图：

但是，每个职业除了工资以外，还有一个重要的参数——成长性。

“成长性”是我们另外计算的一个数据，是使用分经验年度的招聘岗位数据，计算跨年度的经验-工资差异得出的。

举个例子，A岗位，在2018年时，市场上对0年经验需求的招聘岗位平均工资为5000元。2019年时，市场上对1年经验需求的A岗位招聘平均工资为6000元。

不难发现，2018年0年经验的这批人，和2019年时有1年经验的这批人来自同一个队列。因此，6000÷5000=120%，就是同一个队列的人口，从2018到2019年，0到1年经验带来的工资增长倍数。

我们算出所有年份，包括2015到2016、2016到2017……2020到2021、2021到2022这样7个0到1年的经验带来的工资增长倍数，再按照招聘人数加权求平均，就得到了A岗位在过去8年时的0到1年经验带来的工资增长倍数。

用同样的方法，我们再一次算出1到2年的工资增长倍数、2到3年的工资增长倍数……8到9年的工资增长倍数。将每一年的工资增长倍数连乘，就得到了这个岗位从0年经验到9年经验一共10年工作的工资增长倍数，将这个倍数再开九次方，就得到了这个职业的“成长性”，即每增加一年工作年限，工资可能上升多少。

那么，从业年限的工资增长率，即这个工作的“成长性”，和每个职业的AI替代率之间存在什么关系？

可以看到，各职业的AI替代率，和每个职业的年限工资增长率有着非常显著的关系，两者之间存在正相关的显著性水平在0.001以下。如果我们将上图改为分段柱状图，我们将可以看到更明显的趋势。

从上图可以看到，每增加一年从业年限工资增长最慢，低于8%的职业，相对最不容易被AI替代的。但如果一个职业每工作一年工资增长超过20%，被AI替代的可能性平均将大于60%。

这个趋势，说明的是在本轮大语言模型和其衍生出来的相关AI的一个显著特征，那就是人们在一个行业上积累的经验、学到的技巧、掌握的诀窍，是被大语言模型首先替代掉的东西。

被GPT们替代掉的，究竟是什么？

“成长性”越高的工作，越容易被替代，这说明什么呢？

第一种可能，是因为那些学习、工作后能积累更多经验，提高更快生产率的职业，本身更贵，因此更促使人们去找到能替代这些职业的AI，给这样的AI产品更大的投资，因此这样更贵的劳动力就成了第一批牺牲品。

这样的说法初看有道理，但我们也能找到很多反例。最大的反例就是自动驾驶。一方面，驾驶这个技能，人们学习几个小时至多十几个小时就能掌握；另一方面，自动驾驶领域投资在人工智能行业内数一数二，但目前的效果距离全路况自动驾驶依然有很长一段距离

反过来，一些生物、化学方面的技能，化合物寻找、蛋白质折叠，或者是在实验流程上的全自动化，这些人们需要数年专业训练才能掌握的知识，尽管资本的介入比起自动驾驶只能算九牛一毛，却已经有了非常不错的替代AI。

从这点看，因为某职业劳动更贵——为了节省这些劳动力而更多投资AI——更容易造出替代这些职业的AI，这样的逻辑似乎是行不通的。

因此，我们不得不考虑第二种可能——AI确实已经实现甚至超越了人类通过后天的实践学习知识、积累经验和诀窍的技能。

是的，有必要再强调一遍，不是单个技能，也不是一组技能，而是那种通过艰苦的学习实践来获取知识、积累经验的技能，人类已经落后于AI。那些高成长性的职业，不管现在是否还处在安全区，出现替代AI，也许就是这几年，甚至几个月之内的事。

到头来，那些人类孩提时期甚至出生时就已经掌握的技能，那些精巧的人类生物学本能，似乎反而是AI最难模仿和替代的部分。

而那些后天学习到的知识，花上好长时间学会算术、学会写作，学会画画，学会编程、学会做好看的ppt、学会看X光片、学会写法律文书，学会很多种语言并且自如地交流……人类学会了各种各样以此为傲的东西，并觉得这些特征似乎使人类和其他生物产生了哲学上的差异。

但在AI看来，这些东西一文不值。

ChatGPT最强插件Code interpreter，让没技术背景的业务人员都能轻松分析数据!

GPT时代的程序员生存之道

大模型怎样重塑企业级IT应用

人人都去研究大模型而不关注自身的业务和数据，这很危险！

GPT-4是8x2200亿参数的混合模型？这个小道消息传疯了

对不起，AI大模型不是风口

查看全部文章

点击左下角“阅读原文”查看更多精彩文章，公众号推送规则变了，如果您想及时收到推送，麻烦右下角点个在看或者把本号置顶！

继续滑动看下一个

与数据同行

向上滑动看下一个

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”

中国最容易和最难被GPT所代替的TOP25职业！

将标注结果汇总到职业层面

容易被替代的职业都有什么样的特征？

被GPT们替代掉的，究竟是什么？

您可能也对以下帖子感兴趣

”FAN某”的离婚财产分割判决书（全文）

”FAN某”的离婚财产分割判决书（全文）

公益慈善｜“翼行天下 一生守护”慈善项目捐赠仪式圆满举行！

何炅突然高调官宣喜讯，网友恭喜：30年了，终于等到这一天！

哈里斯女粉搞4B运动、毒杀丈夫，回旋镖能否让美国“血流成河”

生成图片，分享到微信朋友圈

中国最容易和最难被GPT所代替的TOP25职业！

将标注结果汇总到职业层面

容易被替代的职业都有什么样的特征？

被GPT们替代掉的，究竟是什么？

您可能也对以下帖子感兴趣

公益慈善｜“翼行天下一生守护”慈善项目捐赠仪式圆满举行！